Application of Upper Confidence Bound to Uncertainty Sampling

نویسندگان

  • Junya Saito
  • Ayumi Shinohara
چکیده

分類器の学習には一般に大量の訓練データが必要である.訓 練データとは特徴ベクトルとラベルの組である.特徴ベクトル だけは簡単に得られるが,そのラベルを得るのは困難な場合が ある. 例えば,メールがスパムかそうでないかを判別する分類器の 学習について考えてみる.まず,大量のメールを収集し,それ ぞれメールを処理して,特徴ベクトルに変換する.またメール がスパムかそうでないかを判断して,ラベルを決定する.大量 のメールを収集し,処理して,特徴ベクトルに変換することは 計算機に任せることができる.しかし,そのメールがスパムか そうでないかの判断は専門家(人間)が行わなければならない. 人間の判断は時間的,経済的にコストが大きい.分類器を学習 させるためのコストを小さくするためには専門家にラベルを質 問する回数を減らす必要がある.質問する回数を減らすために は計算機によって質問を厳選することが重要である. プールベース能動学習はこのような問題を解決しようと研究 されている [6].プールベース能動学習では,分類器の学習と ラベルを質問する特徴ベクトルの選択を並行して行う.すなわ ち,ステップ nにおいて,大量の特徴ベクトルから,質問方策 に従って,特徴ベクトルをひとつ選び,専門家にラベルを質問 する.これを訓練データとし,ステップ n− 1までに得られた 訓練データ集合に追加する.この訓練データ集合を用いて分類 器を学習させる.これを分類器の精度が目標値に達するまで繰 り返す. ここで,X を特徴ベクトル集合,Pn(C+|xi) と Pn(C−|xi) を,それぞれ,ステップ n終了時点での特徴ベクトル xi が C+ と C− である確率の推定値とする. 能動学習で一般的な質問方策は,ステップ n において,ス テップ n− 1終了時点での訓練データ集合で学習させた分類器 がラベルの最も判断のつきにくい特徴ベクトルを選ぶ,という 不確実性サンプリングである [3]. ラベルが C+ と C− の2種類の場合,ステップ nにおいて, 特徴ベクトル xi のラベルの判断のつきにくさは,エントロ ピー関数を用いて,式 (1)のように定義される.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

محاسبه فاصله عدم قطعیت بر پایه آنتروپی شانون و تئوری دمپستر-شافر از شواهد

Abstract Dempster Shafer theory is the most important method of reviewing uncertainty for information system. This theory as introduced by Dempster using the concept of upper and lower probabilities extended later by Shafer. Another important application of entropy as a basic concept in the information theory  can be used as a uncertainty measurement of the system in specific situation In th...

متن کامل

Proposing a Robust Model of Interval Data Envelopment Analysis to Performance Measurement under Double Uncertainty Situations

It is very necessary to consider the uncertainty in the data and how to deal with it when performance measurement using data envelopment analysis. Because a little deviation in the data can lead to a significant change in the performance results. However, in the real world and in many cases, the data is uncertain. Interval data envelopment analysis is one of the most widely used approaches to d...

متن کامل

Designing a Robust Control Scheme for Robotic Systems with an Adaptive Observer

This paper introduces a robust task-space control scheme for a robotic system with an adaptive observer. The proposed approach does not require the availability of the system states and an adaptive observer is developed to estimate the state variables. These estimated states are then used in the control scheme. First, the dynamic model of a robot is derived. Next, an observer-based robust contr...

متن کامل

Task-space Control of Electrically Driven Robots

Actuators of robot operate in the joint-space while the end-effect or of robot is controlled in the task-space. Therefore, designing a control system for a robotic system in the task-space requires the jacobian matrix information for transforming joint-space to task-space, which suffers from uncertainties. This paper deals with the robust task-space control of electrically driven robot manipula...

متن کامل

Bayes Interval Estimation on the Parameters of the Weibull Distribution for Complete and Censored Tests

A method for constructing confidence intervals on parameters of a continuous probability distribution is developed in this paper. The objective is to present a model for an uncertainty represented by parameters of a probability density function.  As an application, confidence intervals for the two parameters of the Weibull distribution along with their joint confidence interval are derived. The...

متن کامل

Eluder Dimension and the Sample Complexity of Optimistic Exploration

This paper considers the sample complexity of the multi-armed bandit with dependencies among the arms. Some of the most successful algorithms for this problem use the principle of optimism in the face of uncertainty to guide exploration. The clearest example of this is the class of upper confidence bound (UCB) algorithms, but recent work has shown that a simple posterior sampling algorithm, som...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010